Ending | Count |
---|---|
있다. | 3039 |
말했다. | 1420 |
밝혔다. | 879 |
했다. | 832 |
것이다. | 693 |
한다. | 594 |
때문이다. | 326 |
된다. | 319 |
전했다. | 257 |
없다. | 246 |
설명했다. | 244 |
됐다. | 226 |
예정이다. | 223 |
보인다. | 211 |
알려졌다. | 203 |
있었다. | 184 |
않았다. | 176 |
강조했다. | 164 |
계획이다. | 160 |
덧붙였다. | 156 |
지적했다. | 145 |
주장했다. | 144 |
아니다. | 131 |
받았다. | 123 |
보였다. | 123 |
못했다. | 114 |
나타났다. | 110 |
않다. | 104 |
보도했다. | 103 |
없었다. | 98 |
In the next four subsections show the most frequent sentence endings consisting of N words, N=1, 2, 3, 4. In this subsection we start with N=1.
The most frequent word-N-grams at the end of sentences give some insight into sentence composition.
Especially for N=1, we only need a small corpus to identify the most frequent sentence beginnings.
select substring_index(sentence, ' ', -1) as beg, count(*) as cnt from sentences group by substring_index(sentence, ' ', 1) order by cnt desc limit 50;
4.3.1.1 Most Frequent Sentence Beginnings I
4.3.1.2 Most Frequent Sentence Beginnings II
4.3.1.3 Most Frequent Sentence Beginnings III
4.3.1.4 Most Frequent Sentence Beginnings IV
4.3.1.2 Most Frequent Sentence Endings II
4.3.1.3 Most Frequent Sentence Endings III
4.3.1.4 Most Frequent Sentence Endings IV